Начнём с первой работы

Knowledge Accumulator

Начнём с первой работы, применяющей большие языковые модели в программировании - OpenAI Codex. В основе GitHub Copilot лежит именно эта модель.

Концептуально система работает так:
1) Обучение - языковая модель GPT файнтюнится на генерацию кода, датасет для этого состоит из пар (docstring, code), взятых из питоновских файлов с кодом на гитхабе.
2) Генерация - Codex генерирует много сэмплов программ (до 1000), которые затем фильтруются по "публичным" тестам (образцам из условия задачи), и выбирается топ программ по среднему логарифму вероятности токена.

Если модель дотюнить на вручную сделанном датасете из пар (docstring, code), то получается модель Codex-S, которая работает ещё немного лучше.

В результате система значительно обходит чистую GPT на датасете с задачками APPS. До superhuman-производительности в этой сфере ещё очень далеко, по причинам, которые мы позднее обсудим. Оставайтесь с нами, чтобы узнать, что было после Codex!

www.tg-me.com/ye/Knowledge Accumulator/com.knowledge_accumulator/4

1.4K viewsedited Mar 5, 2023 at 10:25

tg-me.com/knowledge_accumulator/4

Create: 2023-03-05
Last Update: 2025-06-14 12:12:44

BY Knowledge Accumulator

Warning: Undefined variable $i in /var/www/tg-me/post.php on line 283

Share with your friend now:
tg-me.com/knowledge_accumulator/4

Knowledge Accumulator Telegram | DID YOU KNOW?

How Does Telegram Make Money?

Начнём с первой работы